<html>
 <head>
  <meta charset="utf-8"/>
  <meta content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no" name="viewport"/>
  <title>
   FanJianning: LDA主题模型简介  | 数螺 | NAUT IDEA
  </title>
  <link href="http://cdn.bootcss.com/bootstrap/3.3.6/css/bootstrap-theme.min.css" rel="stylesheet"/>
  <link href="http://cdn.bootcss.com/bootstrap/3.3.6/css/bootstrap.min.css" rel="stylesheet"/>
  <style type="text/css">
   #xmain img {
                  max-width: 100%;
                  display: block;
                  margin-top: 10px;
                  margin-bottom: 10px;
                }

                #xmain p {
                    line-height:150%;
                    font-size: 16px;
                    margin-top: 20px;
                }

                #xmain h2 {
                    font-size: 24px;
                }

                #xmain h3 {
                    font-size: 20px;
                }

                #xmain h4 {
                    font-size: 18px;
                }


                .header {
	           background-color: #0099ff;
	           color: #ffffff;
	           margin-bottom: 20px;
	        }

	        .header p {
                  margin: 0px;
                  padding: 10px 0;
                  display: inline-block;  
                  vertical-align: middle;
                  font-size: 16px;
               }

               .header a {
                 color: white;
               }

              .header img {
                 height: 25px;
              }
  </style>
  <script src="http://cdn.bootcss.com/jquery/3.0.0/jquery.min.js">
  </script>
  <script src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=TeX-AMS-MML_HTMLorMML" type="text/javascript">
   MathJax.Hub.Config({
          tex2jax: {inlineMath: [['$','$'], ['\\(','\\)']]},
          TeX: {equationNumbers: {autoNumber: "AMS"}}
        });
  </script>
  <script src="http://nautstatic-10007657.file.myqcloud.com/static/css/readability.min.js" type="text/javascript">
  </script>
  <script type="text/javascript">
   $(document).ready(function() {
                 var loc = document.location;
                 var uri = {
                  spec: "http://cos.name/2010/10/lda_topic_model/",
                  host: "http://cos.name",
                  prePath: "http://cos.name",
                  scheme: "http",
                  pathBase: "http://cos.name/"
                 };
    
                 var documentClone = document.cloneNode(true);
                 var article = new Readability(uri, documentClone).parse();
     
                 document.getElementById("xmain").innerHTML = article.content;
                });
  </script>
  <!-- 1466466301: Accept with keywords: (title(0.333333333333):门户网站,模型,主题,统计学,服务平台,中国, topn(0.433333333333):入门,模型表示,统计学,R语言,分布,数据挖掘,过程,模型,中文论坛,例子,文档,文章,参数,方法,向量,中国人民大学,中文,语料库,词汇表,建模,算法,篇文章,词频,分词,会议,主题,建宁,单词,论坛,随机).-->
 </head>
 <body class="single single-post postid-2518 single-format-standard sidebar" onload="">
  <div class="header">
   <div class="container">
    <div class="row">
     <div class="col-xs-6 col-sm-6 text-left">
      <a href="/databee">
       <img src="http://nautidea-10007657.cos.myqcloud.com/logo_white.png"/>
      </a>
      <a href="/databee">
       <p>
        数螺
       </p>
      </a>
     </div>
     <div class="hidden-xs col-sm-6 text-right">
      <p>
       致力于数据科学的推广和知识传播
      </p>
     </div>
    </div>
   </div>
  </div>
  <div class="container text-center">
   <h1>
    FanJianning: LDA主题模型简介
   </h1>
  </div>
  <div class="container" id="xmain">
   <div class="hfeed site" id="page">
    <header class="site-header" id="masthead" role="banner">
     <div id="cos-logo">
      <a href="http://cos.name/">
       <img src="http://cos.name/wp-content/themes/COS-kermesinus/images/headers/cos-logo.png"/>
      </a>
     </div>
     <div class="navbar" id="navbar">
      <nav class="navigation main-navigation" id="site-navigation" role="navigation">
       <h3 class="menu-toggle">
        菜单
       </h3>
       <a class="screen-reader-text skip-link" href="http://cos.name/2010/10/lda_topic_model/#content" title="跳至内容">
        跳至内容
       </a>
       <div class="menu-%e6%88%91%e7%9a%84%e8%8f%9c%e5%8d%95-container">
        <ul class="nav-menu" id="menu-%e6%88%91%e7%9a%84%e8%8f%9c%e5%8d%95">
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-home menu-item-4746" id="menu-item-4746">
          <a href="http://cos.name">
           主页
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-has-children menu-item-8120" id="menu-item-8120">
          <a href="http://cos.name/cn">
           论坛
          </a>
          <ul class="sub-menu">
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8124" id="menu-item-8124">
            <a href="http://cos.name/cn/wp-login.php?action=register">
             论坛注册
            </a>
           </li>
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8125" id="menu-item-8125">
            <a href="http://cos.name/cn/wp-login.php">
             论坛登录
            </a>
           </li>
          </ul>
         </li>
         <li class="menu-item menu-item-type-post_type menu-item-object-page menu-item-8110" id="menu-item-8110">
          <a href="http://cos.name/books/">
           图书资料
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8112" id="menu-item-8112">
          <a href="http://cos.name/videos">
           视频教程
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8333" id="menu-item-8333">
          <a href="http://cos.name/salon/">
           统计沙龙
          </a>
         </li>
         <li class="menu-item menu-item-type-post_type menu-item-object-page menu-item-8111" id="menu-item-8111">
          <a href="http://cos.name/chinar/">
           R语言会议
          </a>
         </li>
         <li class="menu-item menu-item-type-post_type menu-item-object-page menu-item-8109" id="menu-item-8109">
          <a href="http://cos.name/training/">
           讲座与培训
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8115" id="menu-item-8115">
          <a href="http://cos.name/cn/forum/comprehensive/job/">
           招聘信息
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-has-children menu-item-4780" id="menu-item-4780">
          <a href="http://cos.name/about">
           关于我们
          </a>
          <ul class="sub-menu">
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8113" id="menu-item-8113">
            <a href="http://cos.name/2008/11/how-to-work-with-cos/">
             加入我们
            </a>
           </li>
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8119" id="menu-item-8119">
            <a href="http://cos.name/donate/">
             赞助我们
            </a>
           </li>
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8114" id="menu-item-8114">
            <a href="http://cos.name/cn/forum/26">
             项目合作
            </a>
           </li>
          </ul>
         </li>
        </ul>
       </div>
       <form action="http://cos.name/" class="search-form" method="get" role="search">
        <label>
         <span class="screen-reader-text">
          搜索：
         </span>
        </label>
       </form>
      </nav>
      <!-- #site-navigation -->
     </div>
     <!-- #navbar -->
    </header>
    <!-- #masthead -->
    <div class="site-main" id="main">
     <div class="content-area" id="primary">
      <div class="site-content" id="content" role="main">
       <article class="post-2518 post type-post status-publish format-standard hentry category-dmml category-bayesian tag-lda tag-topic-model" id="post-2518">
        <header class="entry-header">
         <h1 class="entry-title">
          LDA主题模型简介
         </h1>
         <div class="entry-meta">
          <span class="date">
           <a href="http://cos.name/2010/10/lda_topic_model/" rel="bookmark" title="链向LDA主题模型简介的固定链接">
            <time class="entry-date" datetime="2010-10-08T17:55:53+00:00">
             2010/10/08
            </time>
           </a>
          </span>
          <span class="categories-links">
           <a href="http://cos.name/category/data/dmml/" rel="category tag">
            数据挖掘与机器学习
           </a>
           、
           <a href="http://cos.name/category/computing/bayesian/" rel="category tag">
            贝叶斯方法
           </a>
          </span>
          <span class="tags-links">
           <a href="http://cos.name/tag/lda/" rel="tag">
            LDA
           </a>
           、
           <a href="http://cos.name/tag/topic-model/" rel="tag">
            Topic Model
           </a>
          </span>
          <span class="author vcard">
           <a class="url fn n" href="http://cos.name/author/fan/" rel="author" title="查看所有由范建宁发布的文章">
            范建宁
           </a>
          </span>
         </div>
         <!-- .entry-meta -->
        </header>
        <!-- .entry-header -->
        <div class="entry-content">
         <p align="left">
          上个学期到现在陆陆续续研究了一下主题模型（
          <a href="http://en.wikipedia.org/wiki/Topic_model" target="_blank">
           topic model
          </a>
          ）这个东东。何谓“主题”呢？望文生义就知道是什么意思了，就是诸如一篇文章、一段话、一个句子所表达的中心思想。不过从统计模型的角度来说， 我们是用一个特定的词频分布来刻画主题的，并认为一篇文章、一段话、一个句子是从一个概率模型中生成的。
          <span id="more-2518">
          </span>
         </p>
         <p align="left">
          <a href="http://www.cs.princeton.edu/~blei/" target="_blank">
           D. M. Blei
          </a>
          在2003年（准确地说应该是2002年）提出的LDA（
          <a href="http://www.cs.princeton.edu/~blei/papers/BleiNgJordan2003.pdf" target="_blank">
           Latent Dirichlet Allocation
          </a>
          ）模型（翻译成中文就是——潜在狄利克雷分配模型）让主题模型火了起来， 今年3月份我居然还发现了一个专门的
          <a href="http://cran.r-project.org/web/packages/lda/" target="_blank">
           LDA的R软件包
          </a>
          （7月份有更新），可见主题模型方兴未艾呀。主题模型是一种语言模型，是对自然语言进行建模，这个在信息检索中很有用。
         </p>
         <p align="left">
          LDA主题模型涉及到贝叶斯理论、
          <a href="http://en.wikipedia.org/wiki/Dirichlet_distribution" target="_blank">
           Dirichlet分布
          </a>
          、
          <a href="http://en.wikipedia.org/wiki/Multinomial_distribution" target="_blank">
           多项分布
          </a>
          、图模型、
          <a href="http://en.wikipedia.org/wiki/Variational_Bayes" target="_blank">
           变分推断
          </a>
          、
          <a href="http://en.wikipedia.org/wiki/EM_algorithm" target="_blank">
           EM算法
          </a>
          、
          <a href="http://en.wikipedia.org/wiki/Gibbs_sampling" target="_blank">
           Gibbs抽样
          </a>
          等知识，不是很好懂，LDA那篇30 页的文章我看了四、五遍才基本弄明白是咋回事。那篇文章其实有点老了，但是很经典，从它衍生出来的文章现在已经有n多n多了。主题模型其实也不只是LDA 了，LDA之前也有主题模型，它是之前的一个突破，它之后也有很多对它进行改进的主题模型。需要注意的是，LDA也是有名的Linear Discriminant Analysis（线性判别分析）的缩写。
         </p>
         <p align="left">
          LDA是一种
          <a href="http://en.wikipedia.org/wiki/Unsupervised_learning" target="_blank">
           非监督机器学习
          </a>
          技术，可以用来识别大规模文档集（document collection）或语料库（corpus）中潜藏的主题信息。它采用了词袋（bag of words）的方法，这种方法将每一篇文档视为一个词频向量，从而将文本信息转化为了易于建模的数字信息。但是词袋方法没有考虑词与词之间的顺序，这简化了问题的复杂性，同时也为模型的改进提供了契机。每一篇文档代表了一些主题所构成的一个概率分布，而每一个主题又代表了很多单词所构成的一个概率分布。由于 Dirichlet分布随机向量各分量间的弱相关性（之所以还有点“相关”，是因为各分量之和必须为1），使得我们假想的潜在主题之间也几乎是不相关的，这与很多实际问题并不相符，从而造成了LDA的又一个遗留问题。
         </p>
         <p align="left">
          对于语料库中的每篇文档，LDA定义了如下生成过程（generative process）：
         </p>
         <p align="left">
          1. 对每一篇文档，从主题分布中抽取一个主题；
         </p>
         <p align="left">
          2. 从上述被抽到的主题所对应的单词分布中抽取一个单词；
         </p>
         <p align="left">
          3. 重复上述过程直至遍历文档中的每一个单词。
         </p>
         <p align="left">
          更形式化一点说，语料库中的每一篇文档与 $T$（通过反复试验等方法事先给定）个主题的一个多项分布相对应，将该多项分布记为 $\theta$。每个主题又与词汇表（vocabulary）中的  $V$个单词的一个多项分布相对应，将这个多项分布记为 $\phi$。上述词汇表是由语料库中所有文档中的所有互异单词组成，但实际建模的时候要剔除一些停用词（stopword），还要进行一些词干化（
          <a href="http://en.wikipedia.org/wiki/Stemming" target="_blank">
           stemming
          </a>
          ）处理等。$\theta$ 和$\phi$分别有一个带有超参数（hyperparameter）$\alpha$和$\beta$的Dirichlet先验分布。对于一篇文档$d$中的每一个单词，我们从该文档所对应的多项分布$\theta$中抽取一个主题$z$，然后我们再从主题$z$所对应的多项分布$\phi$中抽取一个单词$w$。将这个过程重复$N_d$次，就产生了文档$d$，这里的$N_d$是文档$d$的单词总数。这个生成过程可以用如下的图模型表示：
         </p>
         <p align="left">
          <img src="http://cos.name/wp-content/uploads/2010/10/LDA.png"/>
          这个图模型表示法也称作“盘子表示法”（plate notation）。图中的阴影圆圈表示可观测变量（observed variable），非阴影圆圈表示潜在变量（latent variable），箭头表示两变量间的条件依赖性（conditional dependency），方框表示重复抽样，重复次数在方框的右下角。
         </p>
         <p align="left">
          该模型有两个参数需要推断（infer）：一个是“文档-主题”分布$\theta$，另外是$T$个“主题-单词”分布$\phi$。通过学习（learn）这两个参数，我们可以知道文档作者感兴趣的主题，以及每篇文档所涵盖的主题比例等。推断方法主要有LDA模型作者提出的变分-EM算法，还有现在常用的Gibbs抽样法。
         </p>
         <p>
          LDA模型现在已经成为了主题建模中的一个标准。如前所述，LDA模型自从诞生之后有了蓬勃的扩展，特别是在社会网络和社会媒体研究领域最为常见。
         </p>
         <div class="wumii-hook">
          <br/>
          <br/>
         </div>
        </div>
        <!-- .entry-content -->
        <footer class="entry-meta">
         <div class="author-info">
          <div class="author-avatar">
           <img src="http://sdn.geekzu.org/avatar/0f724dd2ae26d54dfd05ff44f61f8a84?s=74&amp;d=monsterid&amp;r=g"/>
          </div>
          <!-- .author-avatar -->
          <div class="author-description">
           <h2 class="author-title">
            关于范建宁
           </h2>
           <p class="author-bio">
            中国人民大学统计学院
            <a class="author-link" href="http://cos.name/author/fan/" rel="author">
             查看所有由范建宁发表的文章
             <span class="meta-nav">
              →
             </span>
            </a>
           </p>
          </div>
          <!-- .author-description -->
         </div>
         <!-- .author-info -->
        </footer>
        <!-- .entry-meta -->
       </article>
       <!-- #post -->
       <nav class="navigation post-navigation" role="navigation">
        <h1 class="screen-reader-text">
         文章导航
        </h1>
        <div class="nav-links">
         <a href="http://cos.name/2010/09/a-tutorial-on-package-actuar-2/" rel="prev">
          <span class="meta-nav">
           ←
          </span>
          用R也能做精算——actuar包学习笔记（二）
         </a>
         <a href="http://cos.name/2010/10/cantor-set-and-slln/" rel="next">
          强大数定律与康托三分集
          <span class="meta-nav">
           →
          </span>
         </a>
        </div>
        <!-- .nav-links -->
       </nav>
       <!-- .navigation -->
       <div class="comments-area" id="comments">
        <h2 class="comments-title">
         《
         <span>
          LDA主题模型简介
         </span>
         》有29个想法
        </h2>
        <ol class="comment-list">
         <li class="comment even thread-even depth-1 parent" id="comment-1665">
          <article class="comment-body" id="div-comment-1665">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/6ca0529d22d1bf25a1e5cee3af3456f9?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://bjt.name" rel="external nofollow">
               刘思喆
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2010/10/lda_topic_model/#comment-1665">
              <time datetime="2010-10-08T20:24:56+00:00">
               2010/10/08 20:24
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             如果有个例子就更好啦：）
            </p>
           </div>
           <!-- .comment-content -->
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment odd alt depth-2 parent" id="comment-1668">
            <article class="comment-body" id="div-comment-1668">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/3d6f148d87d190b48e936331c86f61ac?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                <a class="url" href="http://feng.li" rel="external nofollow">
                 Feng
                </a>
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2010/10/lda_topic_model/#comment-1668">
                <time datetime="2010-10-09T07:44:05+00:00">
                 2010/10/09 07:44
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               不错。我来补充一下，这种模型最难懂的地方是Dirichlet process prior. 也就是把一个随机过程作为prior。Dirichlet process是描述这样的一个过程，假设有一个中国餐馆，里面有无限多的桌子，中国人三五成群进来，咱中国人有扎堆的喜好，所以每进来一个人都会看已经坐下的里有没有自己的伙伴，如果有而且那个桌子还有空位子，那么就坐下来，如果没有位子了，只好新开一个桌子。这个过程其实是一个聚类的过程，如果用模型描述那么其实就是一个infinite mixture model.
              </p>
              <p>
               这样的模型优点在于你再也不需要指定你要聚多少类，单个样本到底该规为哪一类了。缺点是计算量会变得巨大，因为你每次都需要模拟Dirichlet process。
              </p>
              <p>
               如果大家有兴趣可以读一些关于Dirichlet process的书，了解一下Pólya’s urn, stick-breaking process什么的。也可以看一些以前Michael I. Jordan关于机器学习的文章， ，David B Dunson 关于  Latent variable methods 的文章。
              </p>
             </div>
             <!-- .comment-content -->
            </article>
            <!-- .comment-body -->
            <ol class="children">
             <li class="comment byuser comment-author-yihui even depth-3" id="comment-2141">
              <article class="comment-body" id="div-comment-2141">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/1022d8e6ebc94e8f6bca9a86cebe312a?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  <a class="url" href="http://yihui.name" rel="external nofollow">
                   谢益辉
                  </a>
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2010/10/lda_topic_model/#comment-2141">
                  <time datetime="2011-05-25T07:39:32+00:00">
                   2011/05/25 07:39
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 刚发现还有这么个“中国餐馆过程”：
                 <br/>
                 <a href="http://en.wikipedia.org/wiki/Chinese_restaurant_process" rel="nofollow">
                  http://en.wikipedia.org/wiki/Chinese_restaurant_process
                 </a>
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
             <li class="comment odd alt depth-3" id="comment-2143">
              <article class="comment-body" id="div-comment-2143">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/3d6f148d87d190b48e936331c86f61ac?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  <a class="url" href="http://feng.li" rel="external nofollow">
                   Feng
                  </a>
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2010/10/lda_topic_model/#comment-2143">
                  <time datetime="2011-05-25T18:51:18+00:00">
                   2011/05/25 18:51
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 其实还有个 Indian buffet process。
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
            </ol>
            <!-- .children -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment byuser comment-author-fan bypostauthor even thread-odd thread-alt depth-1 parent" id="comment-1666">
          <article class="comment-body" id="div-comment-1666">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/0f724dd2ae26d54dfd05ff44f61f8a84?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              范建宁
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2010/10/lda_topic_model/#comment-1666">
              <time datetime="2010-10-08T21:55:27+00:00">
               2010/10/08 21:55
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             我给的Latent Dirichlet Allocation链接里的那篇论文中的第6、7小节就有活生生的例子啦～
            </p>
           </div>
           <!-- .comment-content -->
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment odd alt depth-2" id="comment-1671">
            <article class="comment-body" id="div-comment-1671">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/04383244dece479b92ddba167f86bf3f?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                <a class="url" href="http://home.ustc.edu.cn/~zhanghan" rel="external nofollow">
                 bootstrap
                </a>
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2010/10/lda_topic_model/#comment-1671">
                <time datetime="2010-10-09T15:43:22+00:00">
                 2010/10/09 15:43
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               这玩意太慢
              </p>
             </div>
             <!-- .comment-content -->
            </article>
            <!-- .comment-body -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment byuser comment-author-yihui even thread-even depth-1 parent" id="comment-1667">
          <article class="comment-body" id="div-comment-1667">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/1022d8e6ebc94e8f6bca9a86cebe312a?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://yihui.name" rel="external nofollow">
               谢益辉
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2010/10/lda_topic_model/#comment-1667">
              <time datetime="2010-10-09T04:28:31+00:00">
               2010/10/09 04:28
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             从英文世界跨到中文世界，首先就要迈过分词这一关，英文有天然的分隔符（空格），中文没有。上次李舰介绍的中文分词工具中有开源产品（忘记名字了），不妨拿来具体试试看。
            </p>
           </div>
           <!-- .comment-content -->
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment byuser comment-author-fan bypostauthor odd alt depth-2" id="comment-1670">
            <article class="comment-body" id="div-comment-1670">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/0f724dd2ae26d54dfd05ff44f61f8a84?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                <a class="url" href="http://fan.cos.name/cn/" rel="external nofollow">
                 范建宁
                </a>
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2010/10/lda_topic_model/#comment-1670">
                <time datetime="2010-10-09T12:41:12+00:00">
                 2010/10/09 12:41
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               不知道是不是这个东东：ICTCLAS（http://ictclas.org/）？
              </p>
             </div>
             <!-- .comment-content -->
            </article>
            <!-- .comment-body -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment even thread-odd thread-alt depth-1 parent" id="comment-1678">
          <article class="comment-body" id="div-comment-1678">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/f9b2e1cc05c328fef6b12bbb5c11caa9?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              bensonwu
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2010/10/lda_topic_model/#comment-1678">
              <time datetime="2010-10-13T11:07:22+00:00">
               2010/10/13 11:07
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             下面的贴子里有中文分词的例子，还有用支持向量机文本挖掘的例子。
             <br/>
             <a href="http://cos.name/cn/topic/102130" rel="nofollow">
              http://cos.name/cn/topic/102130
             </a>
            </p>
           </div>
           <!-- .comment-content -->
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment byuser comment-author-fan bypostauthor odd alt depth-2" id="comment-1683">
            <article class="comment-body" id="div-comment-1683">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/0f724dd2ae26d54dfd05ff44f61f8a84?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                <a class="url" href="http://fan.cos.name/cn/" rel="external nofollow">
                 范建宁
                </a>
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2010/10/lda_topic_model/#comment-1683">
                <time datetime="2010-10-13T22:44:27+00:00">
                 2010/10/13 22:44
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               很好很强大！
              </p>
             </div>
             <!-- .comment-content -->
            </article>
            <!-- .comment-body -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment even thread-even depth-1 parent" id="comment-1680">
          <article class="comment-body" id="div-comment-1680">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/f9b2e1cc05c328fef6b12bbb5c11caa9?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              bensonwu
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2010/10/lda_topic_model/#comment-1680">
              <time datetime="2010-10-13T15:13:36+00:00">
               2010/10/13 15:13
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             topicmodels包(依赖tm包)貌拟也可实现这个功能，不过没用过。
            </p>
           </div>
           <!-- .comment-content -->
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment byuser comment-author-fan bypostauthor odd alt depth-2" id="comment-1681">
            <article class="comment-body" id="div-comment-1681">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/0f724dd2ae26d54dfd05ff44f61f8a84?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                <a class="url" href="http://fan.cos.name/cn/" rel="external nofollow">
                 范建宁
                </a>
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2010/10/lda_topic_model/#comment-1681">
                <time datetime="2010-10-13T17:27:10+00:00">
                 2010/10/13 17:27
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               嗯，这个包我知道。
              </p>
             </div>
             <!-- .comment-content -->
            </article>
            <!-- .comment-body -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment byuser comment-author-yihui even thread-odd thread-alt depth-1" id="comment-1774">
          <article class="comment-body" id="div-comment-1774">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/1022d8e6ebc94e8f6bca9a86cebe312a?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://yihui.name" rel="external nofollow">
               谢益辉
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2010/10/lda_topic_model/#comment-1774">
              <time datetime="2010-12-08T00:02:12+00:00">
               2010/12/08 00:02
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             Stanford出了个研究，表述非常直观，各专业每年的论文之间的距离：
             <br/>
             <a href="http://nlp.stanford.edu/projects/dissertations/" rel="nofollow">
              http://nlp.stanford.edu/projects/dissertations/
             </a>
            </p>
           </div>
           <!-- .comment-content -->
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment odd alt thread-even depth-1 parent" id="comment-2400">
          <article class="comment-body" id="div-comment-2400">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/9a12a5455c0ca48be96ccf208330f663?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              mary
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2010/10/lda_topic_model/#comment-2400">
              <time datetime="2011-09-02T15:37:57+00:00">
               2011/09/02 15:37
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             您好，我最近刚开始研究LDA在意见挖掘领域的应用。对LDA这个模型，我还是不太懂。
             <br/>
             比如说我已经训练好一个LDA模型，现在有一篇新的文档，我想要知道这篇文档的主题。是直接将这篇文档归入训练文档，计算出新的参数，从而知道新文档的主题和主题分布吗？
             <br/>
             刚刚研究，提的问题可能很愚蠢，希望得到您的指导！谢谢
            </p>
           </div>
           <!-- .comment-content -->
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment even depth-2" id="comment-3161">
            <article class="comment-body" id="div-comment-3161">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/dde60331a171be91f2749a1abac69c72?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                hogwidl
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2010/10/lda_topic_model/#comment-3161">
                <time datetime="2012-06-25T13:51:44+00:00">
                 2012/06/25 13:51
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               我也不理解。希望有人能解答一下。谢谢。
              </p>
             </div>
             <!-- .comment-content -->
            </article>
            <!-- .comment-body -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment odd alt thread-odd thread-alt depth-1" id="comment-2403">
          <article class="comment-body" id="div-comment-2403">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/20c20898be2734a906d95ef6ef9eb3b3?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              王珍珍
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2010/10/lda_topic_model/#comment-2403">
              <time datetime="2011-09-06T09:49:31+00:00">
               2011/09/06 09:49
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             你好，我最近也在学习这个东西，源码在什么地方下载了？
            </p>
           </div>
           <!-- .comment-content -->
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment even thread-even depth-1" id="comment-2808">
          <article class="comment-body" id="div-comment-2808">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/dd574db0ee709fcd4b76d2fd14485961?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              姜晓伟
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2010/10/lda_topic_model/#comment-2808">
              <time datetime="2012-03-13T22:55:44+00:00">
               2012/03/13 22:55
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             刚开始学习LDA，学习一下~~
            </p>
           </div>
           <!-- .comment-content -->
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment odd alt thread-odd thread-alt depth-1 parent" id="comment-2810">
          <article class="comment-body" id="div-comment-2810">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/6ca0529d22d1bf25a1e5cee3af3456f9?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://bjt.name" rel="external nofollow">
               刘思喆
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2010/10/lda_topic_model/#comment-2810">
              <time datetime="2012-03-16T15:12:23+00:00">
               2012/03/16 15:12
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             刚用lda做了一个实验，太强大了！抑制不住内心强烈的喜悦，跑出来吐个泡～
            </p>
           </div>
           <!-- .comment-content -->
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment byuser comment-author-fan bypostauthor even depth-2" id="comment-2812">
            <article class="comment-body" id="div-comment-2812">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/0f724dd2ae26d54dfd05ff44f61f8a84?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                <a class="url" href="http://fan.cos.name/cn/" rel="external nofollow">
                 范建宁
                </a>
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2010/10/lda_topic_model/#comment-2812">
                <time datetime="2012-03-16T23:09:31+00:00">
                 2012/03/16 23:09
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               哈哈哈哈
              </p>
             </div>
             <!-- .comment-content -->
            </article>
            <!-- .comment-body -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment odd alt thread-even depth-1" id="comment-2878">
          <article class="comment-body" id="div-comment-2878">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/246de68531b51b9eba39e08a0788d810?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://labgao" rel="external nofollow">
               高海东
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2010/10/lda_topic_model/#comment-2878">
              <time datetime="2012-03-29T21:06:39+00:00">
               2012/03/29 21:06
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             同研究LDA，来冒个泡。呵呵。
            </p>
           </div>
           <!-- .comment-content -->
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment even thread-odd thread-alt depth-1" id="comment-3190">
          <article class="comment-body" id="div-comment-3190">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/b3e6cd56390c5e6f406c695c631590f4?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              chao
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2010/10/lda_topic_model/#comment-3190">
              <time datetime="2012-07-08T17:50:36+00:00">
               2012/07/08 17:50
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             理解Dirichlet，最好先了解Beta分布，，，就很容易理解了，，，很牛B的思想，解决互联网社会化领域一些问题，起到了很大的作用，，，很感兴趣，可惜没机会了，，，个人觉得搞这些东西，数学功底+思维很重要，，，，
            </p>
           </div>
           <!-- .comment-content -->
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment byuser comment-author-yixuanq odd alt thread-even depth-1" id="comment-3346">
          <article class="comment-body" id="div-comment-3346">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/f09663fd5fc04bad5e5b09daddb86fe6?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://yixuan.cos.name/cn" rel="external nofollow">
               邱怡轩
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2010/10/lda_topic_model/#comment-3346">
              <time datetime="2012-09-21T07:17:10+00:00">
               2012/09/21 07:17
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             今天听了场关于LDA的报告，因为对LDA没有什么了解，所以很多没有听懂，于是回来看师兄写的这篇文章。可是……可是！！！我发现今天的演讲者就是D. M. Blei啊！！！早知道就先预习一下，好好听今天的报告了，后悔死了！！！
            </p>
           </div>
           <!-- .comment-content -->
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment even thread-odd thread-alt depth-1" id="comment-5481">
          <article class="comment-body" id="div-comment-5481">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://www.baidu.com/p/1012190829" rel="external nofollow">
               1012190829
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2010/10/lda_topic_model/#comment-5481">
              <time datetime="2014-03-28T09:18:41+00:00">
               2014/03/28 09:18
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             LDA
            </p>
           </div>
           <!-- .comment-content -->
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment odd alt thread-even depth-1" id="comment-5626">
          <article class="comment-body" id="div-comment-5626">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://weibo.com/yida" rel="external nofollow">
               hbyido
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2010/10/lda_topic_model/#comment-5626">
              <time datetime="2014-04-30T22:08:10+00:00">
               2014/04/30 22:08
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             包括这篇，比较入门清楚。
            </p>
           </div>
           <!-- .comment-content -->
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment even thread-odd thread-alt depth-1" id="comment-5650">
          <article class="comment-body" id="div-comment-5650">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/6e39d0d513d4c32e4ce2ba333620dc00?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://www.zhouleyu.com/life/efficacy-of-lycium-barbarum" rel="external nofollow">
               zhouleyu
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2010/10/lda_topic_model/#comment-5650">
              <time datetime="2014-05-02T17:44:43+00:00">
               2014/05/02 17:44
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             包括这篇，比较入门清楚。
            </p>
           </div>
           <!-- .comment-content -->
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment odd alt thread-even depth-1" id="comment-5651">
          <article class="comment-body" id="div-comment-5651">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/6e39d0d513d4c32e4ce2ba333620dc00?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://www.zhouleyu.com/life/efficacy-of-lycium-barbarum" rel="external nofollow">
               zhouleyu
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2010/10/lda_topic_model/#comment-5651">
              <time datetime="2014-05-02T17:44:43+00:00">
               2014/05/02 17:44
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             包括这篇，比较入门清楚。
            </p>
           </div>
           <!-- .comment-content -->
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment even thread-odd thread-alt depth-1" id="comment-5652">
          <article class="comment-body" id="div-comment-5652">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/6e39d0d513d4c32e4ce2ba333620dc00?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://www.zhouleyu.com/life/efficacy-of-lycium-barbarum" rel="external nofollow">
               zhouleyu
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2010/10/lda_topic_model/#comment-5652">
              <time datetime="2014-05-02T17:44:43+00:00">
               2014/05/02 17:44
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             包括这篇，比较入门清楚。
            </p>
           </div>
           <!-- .comment-content -->
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment odd alt thread-even depth-1" id="comment-6005">
          <article class="comment-body" id="div-comment-6005">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://t.qq.com/lsx02091458" rel="external nofollow">
               李圣喜
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2010/10/lda_topic_model/#comment-6005">
              <time datetime="2014-07-07T17:02:50+00:00">
               2014/07/07 17:02
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             博主能不能推荐一些主题模型的交流群呢。。。
            </p>
           </div>
           <!-- .comment-content -->
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment even thread-odd thread-alt depth-1" id="comment-6054">
          <article class="comment-body" id="div-comment-6054">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://weibo.com/2261808530" rel="external nofollow">
               Deep_learning309
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2010/10/lda_topic_model/#comment-6054">
              <time datetime="2014-07-19T11:07:59+00:00">
               2014/07/19 11:07
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             LDA那篇30 页的文章我看了四、五遍才基本弄明白是咋回事。那篇文章其实有点老了，但是很经典，从它衍生出来的文章现在已经有n多n多了。
             <br/>
             这篇文章发个链接呗，谢谢！
            </p>
           </div>
           <!-- .comment-content -->
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
        </ol>
        <!-- .comment-list -->
        <p class="no-comments">
         评论已关闭。
        </p>
       </div>
       <!-- #comments -->
      </div>
      <!-- #content -->
     </div>
     <!-- #primary -->
     <div class="sidebar-container" id="tertiary" role="complementary">
      <div class="sidebar-inner">
       <div class="widget-area">
        <aside class="widget widget_text" id="text-3">
         <h3 class="widget-title">
          关注统计之都
         </h3>
         <div class="textwidget">
          <ul>
           <li>
            新浪微博
            <a href="http://weibo.com/cosname">
             @统计之都
            </a>
           </li>
           <li>
            人人网
            <a href="http://renren.com/cosname">
             @统计之都
            </a>
           </li>
           <li>
            Twitter
            <a href="http://twitter.com/cos_name">
             @cos_name
            </a>
           </li>
          </ul>
         </div>
        </aside>
        <aside class="widget widget_text" id="text-6">
         <h3 class="widget-title">
          微信公众平台
         </h3>
         <div class="textwidget">
          <img src="http://cos.name/wp-content/uploads/2013/04/qrcode-8cm.jpg"/>
          <p style="font-size:12px;margin-left:15px">
           微信号 CapStat
          </p>
          <p>
           我们将第一时间向您推送主站和论坛的精彩内容，以及统计之都的线下活动、竞赛、培训和会议信息。
          </p>
         </div>
        </aside>
        <aside class="widget widget_text" id="text-8">
         <h3 class="widget-title">
          站内导航
         </h3>
         <div class="textwidget">
          <ul>
           <li class="page_item">
            <a href="http://cos.name/cn/">
             中文论坛
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/videos/">
             视频
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/salon/">
             统计沙龙
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/books/">
             图书出版
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/training/">
             教育培训
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/about/">
             关于我们
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/donate/">
             捐赠
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/chinar/">
             R语言会议
            </a>
           </li>
          </ul>
         </div>
        </aside>
        <aside class="widget widget_links" id="linkcat-2">
         <h3 class="widget-title">
          友情链接
         </h3>
         <ul class="xoxo blogroll">
          <li>
           <a href="http://stat.ruc.edu.cn" target="_blank" title="中国人民大学统计学院网站">
            中国人民大学统计学院
           </a>
          </li>
          <li>
           <a href="http://rucdmc.net">
            中国人民大学数据挖掘中心
           </a>
          </li>
          <li>
           <a href="http://birc.gsm.pku.edu.cn/" target="_blank">
            北京大学商务智能研究中心
           </a>
          </li>
          <li>
           <a href="http://sam.cufe.edu.cn/" target="_blank" title="中央财经大学统计与数学学院网站">
            中央财经大学统计与数学学院
           </a>
          </li>
          <li>
           <a href="http://tjx.cueb.edu.cn/" target="_blank" title="首都经济贸易大学统计学院网站">
            首经贸统计学院
           </a>
          </li>
          <li>
           <a href="http://www.shookr.com/">
            数客网大数据社区
           </a>
          </li>
          <li>
           <a href="http://www.xueqing.tv/" target="_blank" title="数据科学在线学习平台">
            雪晴数据网
           </a>
          </li>
          <li>
           <a href="http://iera.name/" target="_blank" title="IERA是一个旨在普及、传播和增进工业工程知识的非营利性网站">
            IERA（直通IE）
           </a>
          </li>
         </ul>
        </aside>
        <aside class="widget widget_categories" id="categories-2">
         <h3 class="widget-title">
          全部分类
         </h3>
         <label class="screen-reader-text" for="cat">
          全部分类
         </label>
         <select class="postform" id="cat" name="cat">
          <option value="-1">
           选择分类目录
          </option>
          <option class="level-0" value="925">
           cos访谈  (4)
          </option>
          <option class="level-0" value="659">
           图书出版  (5)
          </option>
          <option class="level-0" value="379">
           数学方法  (14)
          </option>
          <option class="level-1" value="381">
           分析与代数  (1)
          </option>
          <option class="level-1" value="380">
           概率论  (9)
          </option>
          <option class="level-1" value="382">
           随机过程  (5)
          </option>
          <option class="level-0" value="210">
           数据分析  (81)
          </option>
          <option class="level-1" value="203">
           多元统计  (3)
          </option>
          <option class="level-1" value="42">
           数据挖掘与机器学习  (42)
          </option>
          <option class="level-1" value="36">
           生物与医学统计  (17)
          </option>
          <option class="level-1" value="35">
           计量经济学  (4)
          </option>
          <option class="level-1" value="296">
           金融统计  (3)
          </option>
          <option class="level-1" value="303">
           风险精算  (7)
          </option>
          <option class="level-0" value="177">
           模型专题  (15)
          </option>
          <option class="level-1" value="38">
           回归分析  (10)
          </option>
          <option class="level-1" value="41">
           时间序列  (2)
          </option>
          <option class="level-0" value="784">
           每周精选  (24)
          </option>
          <option class="level-1" value="183">
           可视化  (9)
          </option>
          <option class="level-0" value="967">
           沙龙纪要  (3)
          </option>
          <option class="level-0" value="18">
           经典理论  (46)
          </option>
          <option class="level-1" value="37">
           抽样调查  (3)
          </option>
          <option class="level-1" value="4">
           统计推断  (26)
          </option>
          <option class="level-1" value="236">
           试验设计  (7)
          </option>
          <option class="level-1" value="39">
           非参数统计  (3)
          </option>
          <option class="level-0" value="1">
           统计之都  (279)
          </option>
          <option class="level-1" value="884">
           中国R会议  (2)
          </option>
          <option class="level-1" value="885">
           中国R语言会议  (5)
          </option>
          <option class="level-1" value="446">
           出国留学  (3)
          </option>
          <option class="level-1" value="179">
           推荐文章  (90)
          </option>
          <option class="level-1" value="3">
           新闻通知  (75)
          </option>
          <option class="level-1" value="263">
           统计刊物  (10)
          </option>
          <option class="level-1" value="174">
           网站导读  (40)
          </option>
          <option class="level-1" value="204">
           职业事业  (51)
          </option>
          <option class="level-1" value="213">
           高校课堂  (9)
          </option>
          <option class="level-0" value="178">
           统计计算  (28)
          </option>
          <option class="level-1" value="40">
           优化与模拟  (15)
          </option>
          <option class="level-1" value="43">
           贝叶斯方法  (6)
          </option>
          <option class="level-0" value="378">
           软件应用  (116)
          </option>
          <option class="level-1" value="44">
           统计图形  (36)
          </option>
          <option class="level-1" value="110">
           统计软件  (83)
          </option>
         </select>
        </aside>
        <aside class="widget widget_recent_comments" id="recent-comments-2">
         <h3 class="widget-title">
          最新评论
         </h3>
         <ul id="recentcomments">
          <li class="recentcomments">
           <span class="comment-author-link">
            fineboom
           </span>
           发表在《
           <a href="http://cos.name/2016/06/use-shiny-fleetly-set-up-visual-prototype-system/#comment-7317">
            利用shiny包快速搭建可视化原型系统
           </a>
           》
          </li>
          <li class="recentcomments">
           <span class="comment-author-link">
            胡家新
           </span>
           发表在《
           <a href="http://cos.name/2016/06/r%e8%af%ad%e5%8d%83%e5%af%bb%e7%ac%ac%e4%b8%89%e6%9c%9f%ef%bc%9a%e5%bc%a0%e6%97%a0%e5%bf%8c%e7%a9%b6%e7%ab%9f%e7%88%b1%e8%b0%81%ef%bc%9f/#comment-7316">
            R语千寻第三期：张无忌究竟爱谁？
           </a>
           》
          </li>
          <li class="recentcomments">
           <span class="comment-author-link">
            <a class="url" href="http://www.zijiacha.com/category.php?id=6" rel="external nofollow">
             南糯山普洱茶
            </a>
           </span>
           发表在《
           <a href="http://cos.name/2016/06/r%e8%af%ad%e5%8d%83%e5%af%bb%e7%ac%ac%e4%b8%89%e6%9c%9f%ef%bc%9a%e5%bc%a0%e6%97%a0%e5%bf%8c%e7%a9%b6%e7%ab%9f%e7%88%b1%e8%b0%81%ef%bc%9f/#comment-7315">
            R语千寻第三期：张无忌究竟爱谁？
           </a>
           》
          </li>
          <li class="recentcomments">
           <span class="comment-author-link">
            J
           </span>
           发表在《
           <a href="http://cos.name/2016/05/value-of-the-reputation-from-the-data/#comment-7314">
            数据告诉你：高信誉的卖家应该收高价，还是收低价？
           </a>
           》
          </li>
          <li class="recentcomments">
           <span class="comment-author-link">
            <a class="url" href="http://gg" rel="external nofollow">
             Hilda
            </a>
           </span>
           发表在《
           <a href="http://cos.name/2013/01/drawing-map-in-r-era/#comment-7311">
            R时代，你要怎样画地图？
           </a>
           》
          </li>
         </ul>
        </aside>
        <aside class="widget widget_rss" id="rss-282869971">
         <h3 class="widget-title">
          <a class="rsswidget" href="http://cos.name/cn/topics/feed/">
           <img src="http://cos.name/wp-includes/images/rss.png"/>
          </a>
          <a class="rsswidget" href="http://cos.name/cn/topics/feed/">
           中文论坛新帖
          </a>
         </h3>
         <ul>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/417372/">
            处理时间数据和产生时间序列的问题
           </a>
          </li>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/6790/">
            《统计陷阱》下载 （How to lie with statistics）
           </a>
          </li>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/818/">
            统计学的世界（第五版）
           </a>
          </li>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/16574/">
            class(x) 返回值值是AsIs,AsIs代表什么，有什么用处？
           </a>
          </li>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/417366/">
            如何用R绘制一个分类算法的决策规则
           </a>
          </li>
         </ul>
        </aside>
        <aside class="widget widget_text" id="text-2">
         <h3 class="widget-title">
          登录/RSS
         </h3>
         <div class="textwidget">
          <ul>
           <li>
            <a href="http://cos.name/wp-admin/">
             登录
            </a>
           </li>
           <li>
            <a href="http://cos.name/feed/" title="使用 RSS 2.0 同步站点内容">
             文章
             <abbr title="Really Simple Syndication">
              RSS
             </abbr>
            </a>
           </li>
           <li>
            <a href="http://cos.name/comments/feed/" title="RSS 上的最近评论">
             评论
             <abbr title="Really Simple Syndication">
              RSS
             </abbr>
            </a>
           </li>
          </ul>
         </div>
        </aside>
       </div>
       <!-- .widget-area -->
      </div>
      <!-- .sidebar-inner -->
     </div>
     <!-- #tertiary -->
    </div>
    <!-- #main -->
    <footer class="site-footer" id="colophon" role="contentinfo">
     <div class="site-info">
      版权所有 © 2014 统计之都 | 由
      <a href="http://wordpress.org/">
       WordPress
      </a>
      构建 | 主题修改自
      <a href="http://wordpress.org/themes/twentythirteen">
       Twenty Thirteen
      </a>
     </div>
     <!-- .site-info -->
    </footer>
    <!-- #colophon -->
   </div>
   <!-- #page -->
   <p style="margin:0;padding:0;height:1px;overflow:hidden;">
    <a href="http://www.wumii.com/widget/relatedItems" style="border:0;">
     <img src="http://static.wumii.cn/images/pixel.png"/>
    </a>
   </p>
  </div>
 </body>
</html>